Introdução ao Modelamento de Sequências: Dados, Ordem e Dinâmicas Temporais

No domínio da Inteligência Artificial, o modelamento de sequências muda o foco dos instantâneos estáticos para fluxos temporais. Tarefas padrão de aprendizado de máquina frequentemente assumem que os pontos de dados são Independentes e Identicamente Distribuídos (IID), ou seja, a ordem das amostras não influencia o resultado.

O modelamento de sequências rejeita explicitamente isso, concentrando-se em três pilares centrais:

Violação da Invariância por Permutação: Em dados tabulares, a ordem das colunas é arbitrária. Em sequências, a ordem é o atributo principal. Trocar "O gato comeu o rato" por "O rato comeu o gato" muda fundamentalmente o verdade semântica fundamental apesar de termos idênticos.
Autoregressivo Propriedades: Assumimos que uma observação no tempo $t$ é matematicamente condicionada por sua história ($t-1, t-2, \dots, 1$). Isso exige probabilidades de transição para capturar como a informação evolui.
Mapeamento de Comprimento Variável: Ao contrário de grade fixas de 28x28 pixels, sequências como frases ou ondas sísmicas são elásticas. Os modelos devem processar entradas de comprimento $N$ e produzir saídas de comprimento $M$ usando parâmetros consistentes.